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Load Balancing beschleunigt Server- 


Anwendungen 


Wie schaffen es Unternehmen mit stark frequentierten 
Websites, auch bei Zehntausenden gleichzeitigen 
Nutzern die Antwortzeiten kurz zu halten? Vor allem 
durch zahlreiche Server und ausgefeilte Verfahren, die 
die Last der Anfragen sinnvoll verteilen. 


rotz nach wie vor zuneh- 

mender Performance von 
CPUs und l/O-Subsystemen gibt 
es immer wieder Aufgaben, die 
einen einzelnen Server schlicht 
überfordern. Dann helfen auch 
keine Mehrprozessorserver mit 
schnellem Storage und speziell 
optimierten Betriebssystemen 
mehr. Zwar bieten Hersteller 
inzwischen Server mit zwei- 
oder dreistelliger CPU-Zahl von 
der Stange an, doch sind die 
für bestimmte Rechenaufgaben 
— etwa fürs High Performance 
Computing (HPC) - konzipiert 
und nicht für so banale Aufga- 
ben wie Web- oder Maildienste. 

In solchen Fällen bleibt 

einem nichts anderes übrig, als 
die Aufgaben auf mehrere Ser- 
ver zu verteilen — was unter 
Umständen auch preisgünstiger 
sein kann. Dabei unterscheidet 
man zwei Formen von Server- 
Ansammlungen: Während man 
unter einer Serverfarm einen 
lose zusammengewürfelten 
Haufen unabhängiger Server 
versteht, die nicht unbedingt zu- 
sammenarbeiten müssen, ist ein 
Cluster (Schwarm) wesentlich 
strikter organisiert. Jeder Server 
— mit eigenem Betriebssystem — 
darin bildet einen Knoten oder 


Node, doch entscheidend ist die 
Software, die den Cluster zu- 
sammenhält, meist eine Middle- 
ware, die die Aufgaben auf die 
verfügbaren Ressourcen verteilt. 

Cluster beginnen bei zwei 
aus Verfügbarkeitsgründen zu- 
sammengeschalteten Servern, 
von denen einer schlummernd 
auf seinen Einsatz wartet (active/ 
passive), oder die parallel laufen 
(active/active). Beide fallen häu- 
fig unter den Begriff HA-Cluster 
(High Availability). Das andere 
Ende bilden als Rechen-Cluster 
gebaute Supercomputer, deren 
Spitze momentan der frisch ent- 
wickelte und hauptsächlich mili- 
tärisch genutzte Hybrid-Cluster 
„Roadrunner“ mit 122 400 Pro- 
zessorkernen darstellt. Bei ihnen 
steht weniger die Verfügbarkeit 
als vielmehr die akkumulierte 
Rechenleistung im Vordergrund. 
Zwischen diesen beiden Extre- 
men existieren so ziemlich alle 
Formen von Clustern, die man 
sich vorstellen kann. 

Während Serverfarmen häu- 
fig einen ganzen Zoo an Servern 
subsumieren, bestehen Cluster 
meist aus Rechnern mit iden- 
tischer Hardware, was die Or- 
ganisation und Verteilung der 
Anfragen auf die Server verein- 
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facht; dies ist aber nicht zwin- 
gend notwendig. Das Verteilen 
von Aufgaben auf mehrere 
Rechner erhöht grundsätzlich 
die Verfügbarkeit des Gesamt- 
systems. Fällt einer aus, stehen 
die anderen weiterhin zur Verfü- 
gung. Außerdem lassen sich 
Server temporär zum Aufrüsten 
oder für Wartungsarbeiten aus 
dem Verbund nehmen. Deshalb 
bemisst man die Kapazität von 
Clustern häufig so, dass sie auch 
beim Ausfall eines Knotens die 
Lastspitzen abfangen können. 
Besitzen die Server interne, 
exklusive Festplatten, müssen 
sie sicherstellen, dass sie stets 
mit dem gleichen Datenbe- 


stand arbeiten, also die Daten 
laufend synchronisieren. Dafür 
sorgt meist eine Überwachungs- 
software. 


Gemeinschaftsablage 


Übersteigt der Aufwand für das 
Spiegeln den Nutzdatenverkehr, 
bieten sich gemeinsam genutzte 
Speicher an. Voraussetzung da- 
für ist ein externer Speicher, auf 
den alle Server Zugriff haben. Bei 
HA-Clustern genügt meist ein 
externes Dual-Host-SCSI- oder 
-SAS-System (Serial Attached 
SCSI) - samt den entsprechen- 
den Mechanismen, die konkur- 
rierende Zugriffe verhindern. 


ANBIETER VON LOAD- 
BALANCING-PRODUKTEN 


Anbieter 


URL 


Die einfachste Form des 
sogenannten Shared Storage 
bilden Netzwerkfreigaben per 
NFS (Unix) oder CIFS (Win- 
dows). Darüber können alle 
autorisierten Systeme auf die 
benötigten Verzeichnisse und 
Dateien zugreifen (dateibasiert); 
für die Datenkonsistenz sorgen 
NFS und CIFS. Diesem klassi- 
schen Fileserver-Prinzip haben 
die Storage-Hersteller heute 
meist das — moderner klingende 
— Etikett NAS (Network Attached 
Storage) angeklebt. 

Andere Cluster und Server- 
farmen wiederum sind block- 
basiert über ein separates Netz, 
das Storage Area Network 
(SAN), mit Speicher-Subsyste- 
men verbunden. Traditionell 
setzt man bei der Verbindungs- 
technik auf Fibre Channel (FC), 
das inzwischen bei 4 respektive 
8 GBit/s angelangt ist. 

Einige Umgebungen eignen 
sich aber auch für das soge- 
nannte Internet SCSI oder iSCSI 
über eigene Gigabit-Ethernet- 
Leitungen (GE), in seltenen Fäl- 
len über 10 GE. Die vielbe- 
schworene Kombination von 
Ethernet und Fibre Channel hat 
hier allerdings keinen Platz: 
Fibre Channel over IP (FCIP) 
stellt lediglich einen Tunnel 
zwischen zwei entfernten SANs 
her, Internet Fibre Channel 
(iFGP) kann als Hybrid-Protokoll 
mehr als zwei SANs miteinan- 
der verbinden, und Fibre Chan- 
nel over Ethernet (FCoE) steckt 
noch im Rohentwurf und benö- 
tigt — ebenso wie FCIP und iFCP 
— spezielle Switches. 

Für den Serverzugriff erstellt 
man auf den im SAN befind- 
lichen Disk-Subsystemen über 
mehrere Festplatten hinweg 
Volumes - ähnlich einem loka- 
len Logical Volume Manager 
(LVM) — und weist ihnen eine 
SCSI-LUN (Logical Unit Num- 
ber) zu. Darauf kann ein autori- 
sierter Server über seinen FC- 
HBA (Host Bus Adapter), seinen 
ISCSI-HBA oder seine NIC (Net- 
work Interface Card) wie auf 
eine lokale SCSI-Platte zugrei- 
fen. Dazu kommuniziert er mit 


dem Volume - respektive dem 
davorsitzenden RAID-Controller 
- per SCSI-Kommandos. 

Das heißt aber auch, dass im 
Regelfall nur ein Server auf ein 
Volume zugreifen kann - für 
Cluster und Serverfarmen benö- 
tigt man spezielle Lösungen. Sie 
bestehen meist aus Cluster-Da- 
teisystemen wie Red Hats Glo- 
bal File System 2 (GFS2), IBMs 
General Parallel File System 
(GPFS), Lustre oder OCFS2 (Ora- 
cle Cluster File System) [1, 2, 3]. 

Will man die Speichersyste- 
me ihrerseits zusammenfassen 
und gemeinsam arbeiten las- 
sen, greift man dagegen auf 
globale oder verteilte Dateisys- 
teme zurück, die sich über 
mehrere Speichersubsysteme 
erstrecken. Darauf greifen 
mehrere Server oder Cluster- 
Knoten meist über NFS zu. 
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Für bestimmte Anwendungen 
wie datenbankgestützte Web- 
services lassen sich mehrstufige 
Servicekonzepte nutzen, indem 
man die Systeme aufteilt etwa 
in Web-, Application- und Da- 
tenbankserver. Ersterer nimmt 
die Anfragen der Clients ent- 
gegen und beantwortet sie. Per 
Skript in die Webseiten einge- 
baute Datenbankanfragen rich- 
tet der beauftragte Application- 
an den Datenbankserver und 
reicht die aufbereiteten Daten 
an den Webserver zurück. Eine 
große Website kann man außer- 
dem dadurch über mehrere Ser- 
ver verteilen, dass man den Ver- 
zeichnisbaum der Site aufsplittet 
und die Seiten untereinander 
entsprechend verlinkt. 

Ebenso kann man die Last 
von Webservern mit einer ganz 
anderen Technik verteilen: dem 
DNS Load Balancing. Die für 
eine Zone zuständigen Name- 
server lösen in der Regel Host- 
Namen in Adressen (etwa 
www.ix.de zu 193.99.144.80) 
und vice versa auf (siehe auch 
iX extra 5/2007 [5]), können 
aber auch einen oder mehrere 
Redirects von Domain-Namen 
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Einbindung weiterer 
Server einfach möglich 


Zwei Load Balancer verteilen die Aufgaben auf die vorhandenen Server. Zusätzliche Server 
lassen sich jederzeit hinzuschalten (Abb. 1). 


auf Host-Adressen beinhalten, 
häufig auf die des www-Hosts. 

Genauso wie ein Rechner 
mit einer IP-Adresse auf mehre- 
re Namen (Aliase) hören kann, 
kann ein Name - egal ob Do- 
main- oder Host-Name — meh- 
reren IP-Adressen und damit 
mehreren Servern zugeordnet 
sein. Der Nameserver vergibt 
die unterschiedlichen IP-Adres- 
sen dann entweder reihum oder 
nach dem Zufallsprinzip und 
verteilt damit die Zugriffe auf 
mehrere Server. Durch eine Ge- 
wichtung kann er leistungsfähi- 
gere oder mit höherem Durch- 
satz angeschlossene Server 
stärker belasten. 

Dadurch können die Server 
in den Rechenzentren unter- 
schiedlicher Hoster an mehreren 
Orten stehen (Global Server 
Load Balancing, GSLB). Die Me- 
thode eignet sich besonders gut 
zur Erhöhung der Verfügbarkeit. 
Außerdem liegt ihr Reiz in der 
einfachen Realisierbarkeit ohne 
zusätzliche Hardware. Für um- 
fangreiche Installationen und 
hohe Ansprüche an die Perfor- 
mance eignet sich die Lösung 
aber weniger — unter anderem, 
weil der DNS-Server keine 
Rückmeldungen über die Aus- 
lastung der einzelnen Server er- 
hält und somit nur eine statische 
Lastverteilung stattfindet. 
Außerdem lassen sich damit nur 
Internetdienste verteilen. Dafür 
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kann man über eine geschickte 
Zuordnung der DNS-Einträge 
den Zugriff auf weltweit verteilte 
Server optimieren und die An- 
fragen jeweils dem nächstgele- 
genen Server zuordnen. 
Alternativ arbeiten global 
operierende Firmen mit weltweit 
verteilten Caching-Strukturen 
spezieller Dienstleister wie Aka- 
mai. Es liegt in der Natur der 
Sache, dass bei DNS-gestütz- 
tem Load Balancing die Tücken 
persistenter Sessions oder der 
SSL-Verschlüsselung (siehe 
unten) keine Rolle spielen. Da 
die DNS-Abfrage nur einmal er- 
folgt und die Antwort für eine 
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Router 


Load Balancer 


Load Balancer 


gewisse Zeit lokal vorliegt, errei- 
chen alle Folgepakete automa- 
tisch denselben Server. 


Im Takt reihum 


Will man ein oder mehrere 
Geräte vor die Serverfarm 
spannen, die die Anfragen ent- 
gegennehmen und sie gleich- 
mäßig an die Server verteilen, 
greift man zu sogenannten 
Load Balancern. Sie haben 
ihren Ursprung in der Bereit- 
stellung von Internetdiensten. 
In der Regel legt man sie re- 
dundant aus, damit sie keinen 
„Single Point of Failure“ (SPoF) 


Layer 2 Switch 


bilden. Sie können entweder als 
Hot-Standby konfiguriert sein — 
hier übernimmt das Zweitgerät 
nur bei einem Ausfall automa- 
tisch die Arbeit — oder im Paral- 
lelbetrieb. Dass beide Geräte 
gleichzeitig arbeiten, erlauben 
jedoch nicht alle Systeme. Eini- 
ge Hersteller setzen dafür iden- 
tische Geräte voraus. 

Im einfachen Fall verteilt der 
Load Balancer die Anfragen sta- 
tisch, meist reihum (Round 
Robin). Insbesondere für Server 
mit identischer Hardwareaus- 
stattung ist dies eine akzeptable 
Methode. Als Alternative gibt es 
die Aufteilung nach einem vor- 
gegebenen Schlüssel. Server 
unterschiedlicher Leistungsfä- 
higkeit lassen sich durch eine 
einfache Gewichtung berück- 
sichtigen, etwa im Verhältnis 
2:1 (Weighted Round Robin). 

Erzeugen alle Transaktionen 
etwa die gleiche Last auf dem 
Server, bietet sich das Least- 
Connection-Verfahren an. Es 
teilt die Anfrage jeweils dem 
Server zu, der gerade die we- 
nigsten Verbindungen bedient. 

Oft stellt jedoch nicht jede 
Anfrage die gleichen Anforde- 
rungen an Bearbeitungszeit und 
Ressourcen. Effektiver arbeiten 
dynamische Methoden: Eine 
bessere Performance erreicht 
man, wenn der Load Balancer 


Fibre Channel 
Speichernetzwerk 


Serverfarm 


Wer für eine große Anzahl von Servern viele Ports benötigt, die der Load Balancer nicht direkt 
zur Verfügung stellen kann, schaltet weitere Layer-2-Switches davor (Abb. 2). 
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Sollen die Daten auf dem Rückweg den Load Balancer umgehen, müssen die Server direkt über 
einen Layer-2-Switch erreichbar sein. Beide Geräte lassen sich in einem Chassis vereinen (Abb. 3). 


Kenntnis über die Auslastung 
der einzelnen Server hat und 
die nächste Anfrage jeweils 
dem Server zuteilt, der am we- 
nigsten beschäftigt ist. Dazu 
müssen die Server den Load 
Balancer über ihren Auslas- 
tungsgrad in Kenntnis setzen. 
Im einfachsten Fall ermittelt ein 
‚ping denjenigen Server, der am 
schnellsten antwortet, weil er 
vermutlich über die meisten 
freien Ressourcen verfügt 
(Least Response Time). Gleich- 
zeitig lässt sich damit die gene- 
relle Verfügbarkeit, also auch 
ein eventueller Ausfall des Ser- 
vers, feststellen. 

Weitaus bessere Ergebnisse 
erzielt man jedoch mit speziel- 
len Programmen (Agents) auf 
den Servern, die Informationen 
sammeln und an den Load 
Balancer entweder über die be- 
stehende Netzverbindung oder 
eine zusätzliche serielle Leitung 
senden: CPU- und Speicheraus- 
lastung, aber auch die Verfüg- 
barkeit spezieller Ressourcen 
und Daten. Damit kann der 
Load Balancer die Anfragen ge- 
zielter verteilen. Einige Load 
Balancer verwenden dafür das 
Standard-Netzmanagement- 
Protokoll SNMP (Simple Net- 
work Management Protoco)). 


VI 


Verteilungs- 
gerechtigkeit 


Eine Methode, zu der Load Ba- 
lancer gern greifen, ist die Net- 
work Address Translation (NAT), 
die (viele) interne IP-Adressen 
in eine oder mehrere externe 
umsetzt. Sie wurde entwickelt, 
um der Adressenknappheit der 
heute noch geläufigen IP-Ver- 
sion 4 entgegenzuwirken. So 
lassen sich mehr IP-Adressen 
verwenden, als der Internet- 
Provider zuteilt. NAT Load Ba- 
lancing setzt die individuellen 
IP-Adressen mehrerer Server in 
eine einzige um, sodass nach 
außen nur ein logischer Server 


erscheint. Anders als bei NAT 
in Routern arbeiten Load Ba- 
lancer aber nicht mit einer ein- 
deutigen Zuordnung, sondern 
mit einem Algorithmus, der die 
Anfragen lastbezogen auf die 
Server verteilt. Der Vorteil liegt 
in der einfachen Implementie- 
rung, der Nachteil darin, dass 
der Load Balancer den Fla- 
schenhals bildet, denn auch 
alle zurückgesandten Pakete 
passieren ihn zwecks IP- 
Adressumwandlung - vor 
allem, wenn der Rückweg für 
die Performance vieler Anwen- 
dungen wie Downloads oder 
Videoübertragung entschei- 
dend ist. 


Diesen Engpass umgeht ein 
Verfahren namens MAC Address 
Translation (MAT). Dabei lässt 
der Load Balancer die IP-Adres- 
sen unverändert und tauscht 
stattdessen seine MAC-Adresse 
(Media Access Control) gegen 
die des ausgewählten Servers 
aus. Leitet er das Paket weiter, 
besteht eine scheinbar direkte 
Kommunikation zwischen Client 
und Server, während der Server 
die Daten unter Umgehung des 
Load Balancer zurücksendet. 
Dieses Verfahren nennt sich Flat 
Based Load Balancing und be- 
dingt, dass Server und Load Ba- 
lancer über einen Switch ver- 
bunden sind, der eine direkte 
Verbindung zwischen Server 
und Client unter Umgehung des 
Load Balancer erlaubt (siehe Ab- 
bildung 3). 

Ein Load Balancer setzt kei- 
neswegs voraus, dass auf allen 
angeschlossenen Servern die 
gleiche Anwendung läuft, also 
beispielsweise ein Webserver. 
Bestimmte Serveranwendungen 
wie Webdienste, E-Mail, FTP, 
Spiele oder Datenbanken kön- 
nen auf dedizierten Servern lau- 
fen, während ein Load Balancer 
die Anfragen nach der jeweili- 
gen Anwendung verteilt. Dazu 
zieht er den Zielport des ge- 
wünschten Dienstes heran (Net- 
work Address Port Translation 
oder NAPT). In solchen Fällen 
firmieren Load Balancer gern 
unter dem Begriff „Content 
Switch“. Die einfache Aufgabe 
erfordert streng genommen 


Quelle: Team ix 


Klassische Load-Balancer-Appliances im 19-Zoll-Format wie die von Team ix kommen mit 


wenigen Ports aus (Abb. 4). 
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nicht einmal einen Load Balan- 
cer: Ein Router mit NAPT und 
Port Forwarding reicht bereits 
aus. Der kann die Anfragen 
allerdings nur nach Diensten 
und nicht nach Last verteilen. 

Auch die Aufteilung der Web- 
präsenz auf mehrere Server be- 
herrschen einige Load Balancer. 
Sie erkennen dann anhand der 
Verzeichnispfade in der URL, 
welcher Server für die Anfrage 
zuständig ist. So lassen sich lo- 
kale und zentrale, statische und 
dynamische Inhalte oder auch 
einfach nur die schiere Größe 
eines Webauftrittes über mehre- 
re Server streuen. 

Neben der reinen Verteilung 
kann der Load Balancer eine 
Priorisierung vornehmen, also 
Datenpakete bevorzugt behan- 
deln, wenn sie ein Echtzeitver- 
halten erfordern (etwa Sprache) 
oder zu einer wichtigen Anwen- 
dung gehören. Beispielsweise 
bietet es sich an, HTTPS 
gegenüber HTTP zu priorisie- 
ren, um Bestell- und Zahlungs- 
vorgänge zügig abzuwickeln. 


Hoch hinaus 


Für viele Anwendungen reichen 
die genannten einfachen Algo- 
rithmen der Lastverteilung nicht 
aus — etwa wenn der Load Ba- 
lancer logisch zusammengehö- 
rige Datenpakete identifizieren 
und dem richtigen Server zuord- 
nen muss. Viele Webanwendun- 
gen wie E-Commerce oder On- 


linebanking arbeiten transak- 
tionsorientiert, was bedeutet, 
dass sie eine gewisse Anzahl 
elementarer Transaktionen zu- 
sammenhängend ausführen 
müssen, etwa Auswahl der 
Ware, Eingabe der Lieferadresse 
und Überprüfung der Kreditkar- 
te. Dazu stellen sie eine logische 
Verbindung zwischen Client und 
Server her, die sogenannte Ses- 
sion oder Sitzung, die für den 
gesamten Vorgang gilt. 

Der Load Balancer muss si- 
cherstellen, dass eine Session 
komplett auf einem Server läuft. 
Dazu muss er tief in den Inhalt 
der Datenpakete vordringen 
(Deep Packet Inspection). Es 
gibt unterschiedliche Informatio- 
nen, die der Load Balancer dafür 
heranziehen kann, Datenpakete 
einer offenen Session zuzuord- 
nen, etwa die IP-Adresse des 
Absenders, eine Session- oder 
SSL-ID oder Cookies. 

Mit Hash-Verfahren kann 
man das Speichern und Suchen 
der Quell-IP-Adressen umge- 
hen. Über eine Hash-Tabelle 
ordnet der Load Balancer dabei 
die Client-IP-Adresse dem Ziel- 
server zu. Entspricht die Quell- 
adresse im Datenpaket nicht 
der wirklichen Adresse des 
Clients, weil ein Proxy oder 
NAT-Router vorgeschaltet ist, 
läuft die Maßnahme ins Leere. 

Fällt ein Server während 
einer Session aus, hängt es von 
der Anwendung ab, ob ein an- 
derer Server sie übernehmen 


Quelle: Foundry Networks 


Viel Eisen für große Server: Foundrys Server Iron bietet eine 
hohe Portdichte und nutzt bei Bedarf 10-Gigabit-Ethernet 


(Abb. 5). 
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kann. Der Load Balancer kann 
zwar die Datenpakete einfach 
an einen anderen Server weiter- 
leiten, aber der Anwender merkt 
nur dann nichts davon, wenn 
Anwendung und Daten es erlau- 
ben. Andernfalls muss er die 
letzte Aktion wiederholen. 
Neben den Session-Informa- 
tionen muss der Load Balancer 
je nach Anwendung eine Reihe 
anderer Informationen auswer- 
ten, beispielsweise Cookies, 
Browser- und Gerätetypen oder 
Teile der URL. Hinzu kommt, 
dass E-Commerce- und Ban- 
king-Sessions in der Regel mit 
SSL (Secure Socket Layer) oder 
TLS (Transport Layer Security) 
verschlüsselt ablaufen, was zu- 
sätzliche Anforderungen an die 
Kapazität des Load Balancer 
stellt. Da er die relevanten Infor- 
mationen aus verschlüsselten 
Datenpaketen nicht ermitteln 
kann, muss der Load Balancer 
als Endpunkt der Verschlüsse- 
lung fungieren. Einige Herstel- 
ler bieten hierfür zusätzliche 
Hardware zur Erhöhung der 
Leistungsfähigkeit an. 


Zwei links, 
zwei rechts 


Während Layer-2-Switches nur 
wenige Bytes (vornehmlich die 
Adressen) zum Weiterleiten des 
Pakets analysieren müssen, 
benötigen Load Balancer weite- 
re Informationen, die aus höhe- 
ren Protokollschichten stam- 
men. Deshalb bezeichnet man 
sie auch als Layer-4-7- oder 
einfach als Layer-7-Switches. 
Sie müssen stets das gesamte 
Paket zwischenspeichern und 
auswerten und benötigen daher 
deutlich mehr Rechenkapazität 
als Switches oder Router (siehe 
auch iX extra 1/2006 [6]). 

Für eine gute Performance 
setzen viele Hersteller auf 
schnelle Switch-Hardware mit 
entsprechenden Puffern für die 
Datenpakete, die Basisfunktio- 
nen besonders schnell ausfüh- 
ren kann. Darauf installieren sie 
Spezialsoftware für die Zusatz- 
funktionen. Obwohl sie Ge- 


schwindigkeitsvorteile bieten, 
finden sich heute kaum noch 
Load Balancer am Markt, die 
nur auf Layer 4 arbeiten. Grund 
sind die immer schnellere 
Hardware und der Wunsch 
nach mehr Funktionsumfang 
und Flexibilität. 

Da der Load Balancer für 
seine Arbeit bereits große Teile 
aus dem Header und dem Da- 
tenteil der Pakete analysieren 
muss, fällt es leicht, an dieser 
Stelle Erweiterungen anzusie- 
deln, etwa Sicherheitsfunktio- 
nen wie Access Control, Intru- 
sion Detection, eine Firewall 
oder Traffic Management — 
und das auch auf Anwen- 
dungsebene. Derlei Funktionen 
haben Load Balancern auch 
den Namen „Reverse Proxy“ 
eingetragen, weil sie ähnlich 
wie ein Proxy-Server agieren, 
um Performance und Sicher- 
heit zu erhöhen - nur eben 
nicht vor den Clients, sondern 
vor den Servern. 

Heute bedeutet Load Balan- 
cing Skalierung und Ausfallsi- 
cherheit für zahlreiche Server- 
anwendungen, also auch für 
Voice over IP (etwa in IP-TK-An- 
lagen) oder Video-Streaming. Es 
bietet darüber hinaus die direk- 
te Unterstützung von Datenban- 
ken oder großer Anwendungen 
wie SAP oder Oracle. Aber nicht 
nur Anwendungen im eigent- 
lichen Sinn nutzen Load Balan- 
cing, sondern auch eine Reihe 
von Diensten aus der Internet- 
Infrastruktur wie DNS, DHCP 
und Radius, die Terminierung 
von VPN-Tunneln oder Lastver- 
teilung zwischen Firewalls. 

Neben dem großen Anwen- 
dungsgebiet Internet spielt das 
Load Balancing auch bei fir- 
meninternen Client-Server-An- 
wendungen eine Rolle, einem 
Thema, das mit zunehmendem 
Einsatz von Thin Clients eine 
Renaissance erlebt. 

Leistungsparameter für Load 
Balancer sind die Anzahl der 
gleichzeitig handhabbaren Ses- 
sions (gegebenenfalls mit SSL- 
Verschlüsselung), die Bearbei- 
tungszeit pro Datenpaket sowie 
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Quelle: Cisco 


Cisco integriert Lastverteilungs-Funktionen in Service-Module für die Gatalyst-Switches und 
nennt sie ACE wie Application Control Engine (Abb. 6). 


Anzahl und Durchsatz der ver- 
fügbaren Ports. Darüber hinaus 
unterscheiden sie sich hinsicht- 
lich ihrer Arbeitsweise auf Layer 
4 bis 7, der Unterstützung spe- 
zieller Anwendungen sowie 
möglicher Zusatzfunktionen, 
zum Beispiel Security. 


Hard- oder Software? 


Load Balancer können recht 
unterschiedlich ausgeführt sein 
und im einfachen Fall auf Stan- 
dardhardware und -software 
aufsetzen, wie etwa die Appli- 
ance von Zeus, die aus Linux- 
gesteuerten PC-Komponenten 
besteht. Das ermöglicht eine 
kostengünstige Lösung und 
hohe Flexibilität. Erweiterungen 
wie Sicherheitsfunktionen las- 
sen sich einfach verwirklichen. 
Auch reine Softwarelösungen 
sind erhältlich, beispielsweise 
Virtual Appliance von Loadba- 
lancer.org oder BalanceNG von 
Inlab. Eine Reihe von Herstel- 
lern nutzt als Softwaregrund- 
lage Linux Virtual Server, eine 
frei verfügbare Software für 
Linux-Server. Mit ausreichen- 
der Kenntnis kann man sie auf 
einer Serverfarm installieren, 
die unter Linux läuft (www.linux 
virtualserver.org). Die offenen 
Schnittstellen erlauben eine 
einfache Anpassung und Er- 
weiterung, etwa durch den 
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Einsatz kundenspezifischer 
Skripte. 

Eine höhere Performance 
lässt sich mit Spezialhard- und 
-software erzielen, bis hin zu 
dafür optimierten ASICs. Ent- 
sprechend den immer komple- 
xeren Anwendungen und zu- 
sätzlichen Anforderungen finden 
sich kaum noch Geräte, die 
sich auf reines Load Balancing 
beschränken, und auch die 
Hersteller rücken dies nicht 
mehr in den Vordergrund. F5 
etwa rüstet seine Viprion-Serie 
mit einer Reihe zusätzlicher 
Funktionen aus und verkauft 
sie als Application Delivery 
Controller (ADC); Cisco wiede- 
rum implementiert die Funktio- 
nen auf einem Board in den 
modularen Layer-2-Switches 
und nennt es Application Con- 
trol Engine (ACE). Für kleinere 
Unternehmen ist diese Funktion 
aber auch in einem separaten 
Chassis erhältlich. 

Seit der Übernahme der 
Technikpioniere Alteon durch 
Nortel und Arrowpoint durch 
Cisco gehört Load Balancing zu 
den Produktportfolios der gro- 
ßen Hersteller von Netzwerk- 
geräten. Dort läuft es aber 
meist unter Schlagworten wie 
Content Delivery Network (CDN) 
oder Application Acceleration. 
Das zeigt, dass Load Balancing 
eine ergänzende Technik zur 


Beschleunigung und Skalierung 
von Serveranwendungen ist, 
die sich je nach Anwendung 
durch andere ergänzen oder er- 
setzen lässt. Einige Hersteller, 
etwa Radware, bilden die Funk- 
tionen in separaten Geräten 
(Appliances) ab, andere als 
separate Module oder in eine 
große Box integriert. 

Weitere Bestandteile von 
CDNs sind Caching oder Strea- 
ming-Verfahren wie Multicast. 
Erstere dienen vor allem der Be- 
schleunigung von Downloads, 
indem Kopien der Daten in loka- 
len oder global verteilten Caches 
nah am Client liegen und dazu 
beitragen, dass entsprechende 
Anforderungen oft gar nicht bis 
zum eigentlichen Server gelan- 
gen müssen. Beim Multicasting 
fürs Audio- und Video-Strea- 
ming baut nicht jeder Client eine 
exklusive Verbindung zum Ser- 
ver auf. Vielmehr nutzen meh- 
rere Clients Teile der Datenlei- 
tungen gemeinsam. Andere 
CDN-Techniken sind zum Bei- 
spiel Traffic Flow Management 
und Datenkompression. Je nach 
konkretem Angebot verstehen 
die Hersteller unter CDN auch 
nur einzelne der genannten As- 
pekte, etwa das Caching. 
Manchmal bezieht sich der Be- 
griff „Load Balancing“ nur auf 
Layer 4, in Unterscheidung zu 
CDN auf Layer 7. 


Mit zunehmender Auslage- 
rung von Servern aus dem ei- 
genen Rechenzentrum zu Hos- 
tern und der Entwicklung zu 
Produkten wie Managed Server 
(siehe iX extra 9/2007 [7]) 
nimmt auch die Zahl der Load 
Balancer in den Rechenzentren 
der Hoster zu. Neben der einfa- 
chen Form des Unterstellens 
der Geräte als Co-Location- 
oder Rackspace-Angebote mit 
eigener Verantwortung bieten 
Hoster zunehmend Lösungen 
zum Management der gesam- 
ten Hardware einschließlich 
Load Balancer, Firewall et ce- 
tera an. Das entlastet den Auf- 
traggeber von den technischen 
Details, erfordert aber eine ge- 
naue Spezifikation der Leis- 
tungsparameter, die es zu er- 
füllen gilt. (hw/sun) 

Uwe Schulze 
ist Fachautor in Berlin. 
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Balanceakt 


Software für Load-Sharing- und 


Failover-Cluster 


Eine Alternative zur Load-Balancer-Appliance sind 
Softwarepakete zur Lastverteilung. Will man das 
Nadelöhr eines vorgeschalteten Servers oder Geräts 
vermeiden, kann man die Server auch direkt 
zusammenschalten — zum Load-Sharing- oder 


Fallover-Cluster. 


er nur zwei oder drei 

Server zusammen- 
schalten will, wird sich erst ein- 
mal - schon aus Kostengründen 
— nach einer geeigneten Soft- 
ware für das Load Balancing 
umschauen. Dabei findet man 
solche, mit der sich Standard- 
hardware in einen vorgeschalte- 
ten Load Balancer verwandeln 
lässt, und solche, die direkt auf 
den beteiligten Servern läuft 
und dort die Aufgaben verteilt. 
Außerdem gibt es eine Reihe 
von Betriebssystemen und Dis- 


/ LAN/WAN/ 
\ Internet 


ER 


tributionen wie OpenBSD und 
Red Hat Cluster Server, die die 
Lastverteilung von sich aus be- 
herrschen. Microsoft hat seinen 
Cluster Service (MSCS) und das 
Network Load Balancing (NLB) 
ebenfalls in einige Versionen der 
Windows Server 2003 und 2008 
integriert. 

Beim integrierten Konzept — 
ohne vorgeschalteten Load Ba- 
lancer - sprechen die Hersteller 
gern von „Cluster-Lösungen“, 
was schnell zu einer Verwech- 
selung mit dem sogenannten 


HA-Cluster führt (siehe Artikel 
„Des anderen Last“, S. I). Zu- 
mindest eins haben beide 
gemeinsam: Jeder Cluster er- 
scheint nach außen als ein ein- 
ziger logischer Rechner; seine 
Mitglieder (Knoten) haben eine 
„gemeinsame Identität“ (siehe 
Abbildung 1). 

Zudem benutzt ein Active/ 
active-Rechnerverbund den- 
selben Überwachungsmecha- 
nismus wie ein HA-Cluster 
(active/passive). Sogenannte 
Watchdogs halten die anderen 
Mitglieder des Clusters per 
Heartbeat über den eigenen 
Gesundheitszustand und gege- 
benenfalls über den Auslas- 
tungsgrad auf dem Laufenden. 
Verstummen die Lebenszei- 
chen, läuft nach wenigen Se- 
kunden eine Konvergenz ge- 
nannte Routine ab, die den 
ausgefallenen Rechner aus 
dem Cluster entfernt respektive 
vom Stromnetz trennt. In den 
meisten Fällen übernimmt ein 
Knoten die interne Verwaltung 
des Clusters: der Master-Kno- 
ten. Fällt der aus, stimmen in 
größeren Rechner-Verbänden 
die verbleibenden Mitglieder 


Failover-Cluster 


Storage Area Network (SAN) 


Shared Storage 


Wie jeder Cluster erscheint auch der Failover-Cluster, dessen Knoten hier auf ein gemeinsames 
Speichersystem zugreifen, als ein logischer Rechner im Netz (Abb. 1). 


X 


per „Quorum“ darüber ab, wer 
der neue Master-Knoten wird. 


Einfach verteilen 


Anders als bei HA-Clustern tritt 
der Verfügbarkeitsaspekt bei 
Load-Sharing-Clustern in den 
Hintergrund. Beim Ausfall eines 
Knotens verteilen sich neue An- 
fragen auf die verbliebenen Miit- 
glieder. Dieser Mechanismus ist 
jedoch nicht für jede Anwen- 
dung geeignet, vor allem wenn 
Sessions unterbrochen werden, 
Informationen verloren gehen 
und die Benutzer ihre Program- 
me erneut starten müssen. Das 
Hauptanwendungsgebiet der 
Load-Sharing-Cluster sind Web- 
server — wie bei den vorge- 
schalteten Load Balancern. Dar- 
über hinaus kommen derartige 
Cluster beispielsweise als Strea- 
ming-Media-, Terminal-, VPN- 
und Proxy-Server sowie als Fire- 
wall vor. 

Ein Beispiel dafür ist das 
Network Load Balancing von 
Microsoft. Es kennt zwei Be- 
triebsarten: Unicast und Multi- 
cast (siehe Abbildung 2). Im 
Unicast-Modus erhalten alle 
Hosts im Cluster dieselbe vir- 
tuelle MAC-Adresse (Media Ac- 
cess Control). Auf diese Weise 
können sie die für den Cluster 
bestimmten Datenpakete paral- 
lel in Empfang nehmen; an- 
schließend entscheidet jeder 
Host selbst, ob ein Paket für ihn 
bestimmt ist oder nicht. Damit 
sowohl der Austausch von 
Heartbeats als auch die Kon- 
vergenz problemlos funktionie- 
ren, kommunizieren die Hosts 
über ein separates Netz, für 
das sie eine zweite Netzwerk- 
karte besitzen. 

Dagegen behalten die Hosts 
im Multicast-Modus ihre eigene 
MAC-Adresse und kommen da- 
durch mit einer Netzwerkkarte 
aus. Multicasting hat jedoch 
den Nachteil, dass eine Reihe 
von Routern und Switches 
damit nicht zurechtkommt und 
sie deshalb ein Nachkonfigurie- 
ren von Hand erfordern. Der 
Admin nimmt im Router einen 
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Microsofts Network Load Balancing hier auf einem Windows Server 2003 - kann im Unicast- 
oder im Multicast-Modus arbeiten (Abb. 2). 


statischen ARP-Eintrag (Address 
Resolution Protocol) vor, der die 
gemeinsame Cluster-IP-Adresse 
mehreren MAC-Adressen zuord- 
net. Um diesen Aufwand zu spa- 
ren, arbeitet Microsofts Network 
Load Balancing standardmäßig 


nehmen und auf die zuletzt ge- 
nutzten Daten zuzugreifen. Im 
Idealfall bemerken die Nutzer 
davon nichts oder höchstens 
eine um einige Sekunden verzö- 


gerte Reaktion des Systems. Vor 
allem können sie sich darauf 
verlassen, dass keine Daten 
verloren gehen. Failover-Clus- 
ter stellen in Datenbanken, 


Messaging-Systemen und 
Terminaldiensten sowie in 
Datei- und Druckdiensten die 
Skalierbarkeit und eine hohe 
Verfügbarkeit sicher. 
Allerdings erfordern Failover- 
einen höheren Aufwand als 
reine Load-Sharing-Cluster. 
Außer dem gemeinsam genutz- 
ten Speicher besitzen sie ent- 
weder zusätzliche Knoten, die 
bei Störungen in Aktion treten, 
oder in der Kalkulation ihrer /O- 
und Rechenkapazität ist der 
Ausfall eines Knotens mit be- 
rücksichtigt (N+1). Die Knoten, 
die noch miteinander kommuni- 
zieren können, müssen dazu 
aushandeln, wer von ihnen 
weiterhin im Cluster verbleiben 
darf und wer die Master-Funk- 
tion übernimmt. Dazu schreiben 
alle verbliebenen Knoten nach 
einem ausgefeilten Schema auf 
eine „Voting Disk“. Und sie 
müssen feststellen, ob andere 
ehemalige Cluster-Mitglieder 
versuchen, auf ihr Dateisystem 
zuzugreifen. Für dieses Proze- 
dere sind in der Regel mehrere 
Neustarts der beteiligten Rech- 
ner nötig. (hw/sun) 
Dagmar Hemke 
ist IT-Beraterin in Berlin. 


im Unicast-Modus. 


In iX extra 10/2008: 


Embedded Systems - 
Echtzeit- und eingebettete Betriebssysteme 


Stets zu Diensten 


Eine höhere Ausfallsicherheit 


als reine Load-Sharing-Cluster 
bieten solche mit Failover- 
Funktion. Sie arbeiten mit den 
im vorangehenden Beitrag be- 
schriebenen Cluster-Dateisys- 
temen (siehe Abbildung 1) auf 
externen RAID-Subsystemen, 
meist über ein SAN angebun- 
den. Typische Vertreter für Fail- 


80 000 Systementwickler arbei- 
ten nach Berechnungen von 
Branchenkennern an Embedded- 
Software, die in unterschied- 
lichen Geräten ihren Dienst tut: in 
Autos, Herzschrittmachern, Flug- 
zeugen, industriellen Anlagen 
oder Consumer-Geräten. 


Welche speziellen Anforde- 
rungen erfüllen eingebettete 
Betriebssysteme in den unter- 


schiedlichen Anwendungsberei- 


chen? Wie sieht es mit der Echt- 


zeitfähigkeit aus? Welche Rolle 
spielen Open-Source-Systeme? 


Eine Marktübersicht verschafft 


den Überblick. Darüber hinaus 
beleuchtet das kommende iX 
extra Werkzeuge, die Entwickler 
bei ihrer Arbeit unterstützen, zum 
Beispiel Debugger und Compiler. 
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over-Cluster sind HPs Service- 
quard für Linux, Novells Cluster 
Services für Netware 5 und Mi- 
crosofts Failover Cluster Ser- 
vice für Windows Server 2008. 
Dank gemeinsamer Nutzung 
des Shared Storage sind die 
Cluster-Knoten in der Lage, die 
Aufgaben eines ausgefallenen 
Knotens unmittelbar zu über- 
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